SPSS：多个样本率的卡方检验及两两比较

查看原文

其他

SPSS：多个样本率的卡方检验及两两比较

原创 2017-09-26 李侗桐 医咖会

医咖会之前推送过“两个率的比较(卡方检验)及Fisher精确检验的SPSS教程”，小伙伴们都掌握了吗？如果不止两个分组，又该如何进行卡方检验以及之后的两两比较呢？来看详细教程吧！

1、问题与数据

某医生拟探讨药物以外的其他方法是否可降低患者的胆固醇浓度，如增强体育锻炼、减少体重及改善饮食习惯等。

该医生招募了150位高胆固醇、生活习惯差的受试者，并将其随机分成3组。其中一组给予降胆固醇药物，一组给予饮食干预，另一组给予运动干预。经过6个月的试验后，该医生重新测量受试者的胆固醇浓度，分为高和正常两类。

该医生收集了受试者接受的干预方法（intervention）和试验结束时胆固醇的风险程度（risk_level）等变量信息，并按照分类汇总整理，部分数据如下：

注释：本研究将胆固醇浓度分为“高”和“正常”两类，只是为了分析的方便，并不代表临床诊断结果。

2、对问题的分析

研究者想判断干预后多个分组情况的不同。如本研究中经过降胆固醇药物、饮食和运动干预后，比较各组胆固醇浓度的变化情况。针对这种情况，我们建议使用卡方检验(2×C)，但需要先满足5项假设：

假设1：观测变量是二分类变量，如本研究中试验结束时胆固醇的风险程度变量是二分类变量。

假设2：存在多个分组（>2个），如本研究有3个不同的干预组。

假设3：具有相互独立的观测值，如本研究中各位受试者的信息都是独立的，不会相互干扰。

假设4：研究设计必须满足：(a) 样本具有代表性，如本研究在高胆固醇、生活习惯差的人群中随机抽取150位受试者；(b) 目的分组，可以是前瞻性的，也可以是回顾性的，如本研究中将受试者随机分成3组，分别给予降胆固醇药物、饮食和运动干预。

假设5：样本量足够大，最小的样本量要求为分析中的任一预测频数大于5。

经分析，本研究数据符合假设1-4，那么应该如何检验假设5，并进行卡方检验(2×C)呢？

3、思维导图

4、SPSS操作

4.1 数据加权

在进行正式操作之前，我们需要先对数据加权，如下：

(1) 在主页面点击Data→Weight Cases

弹出下图：

(2) 点击Weight cases by，激活Frequency Variable窗口

(3) 将freq变量放入Frequency Variable栏

(4) 点击OK

4.2 检验假设5

数据加权之后，我们要判断研究数据是否满足样本量要求，如下：

(1) 在主页面点击Analyze→Descriptive Statistics→Crosstabs

弹出下图：

(2) 将变量intervention和risk_level分别放入Row(s)栏和Column(s)栏

(3) 点击Statistics，弹出下图：

(4) 点击Chi-square

(5) 点击Continue→Cells

(6) 点击Counts栏中的Expected选项

(7) 点击Continue→OK

经上述操作，SPSS输出预期频数结果如下：

该表显示，本研究最小的预测频数是24.7，大于5，满足假设5，具有足够的样本量。Chi-Square Tests 表格也对该结果做出提示，如下标注部分：

即在本研究中，没有小于5的预测频数，可以直接进行卡方检验(2×C)。那么，如果存在预测频数小于5的情况，我们应该怎么办呢？一般来说，如果预测频数小于5，就需要进行Fisher精确检验(2×C)，我们将在后面推送的内容中向大家详细介绍。

4.3 卡方检验(2×C)的SPSS操作

(1) 在主页面点击Analyze→Descriptive Statistics→Crosstabs

弹出下图：

(2) 点击Statistics，弹出下图：

(3) 点击Chi-square

(4) 点击Continue→Cells

(5) 点击Percentage栏中的Column选项

(6) 点击Continue→OK

4.4 组间比较

(1) 在主页面点击Analyze→Descriptive Statistics→Crosstabs

弹出下图：

(2) 点击Cells，弹出下图：

(3) 点击z-test栏中的Compare column proportions和Adjust p-values (Bonferroni method)选项

(4) 点击Continue→OK

5、结果解释

5.1 统计描述

在进行卡方检验(2×C)的结果分析之前，我们需要先对研究数据有个基本的了解。SPSS输出结果如下：

该表提示，本研究共有150位受试者，根据干预方式均分为3组。在试验结束时，药物干预组的50位受试者中有16位胆固醇浓度高，饮食干预组的50位受试者中有28位胆固醇浓度高，而运动干预组的50位受试者中有30位胆固醇浓度高，如下标注部分：

由此可见，药物干预比饮食或运动干预的疗效更好。同时，该表也提示，药物干预组的50位受试者中有34位胆固醇浓度下降，饮食干预组的50位受试者中有22位胆固醇浓度下降，而运动干预组的50位受试者中只有20位胆固醇浓度下降，如下标注部分：

但是，当各组样本量不同时，频数会误导人们对数据的理解。因此，我们推荐使用频率来分析结果，如下标注部分：

该表提示，药物干预组的50位受试者中68%胆固醇浓度下降，饮食干预组的50位受试者中44%胆固醇浓度下降，而运动干预组的50位受试者中只有40%胆固醇浓度下降，提示药物干预比饮食和运动干预更有效。但是这种直接的数据比较可能受到抽样误差的影响，可信性不强，我们还需要进行统计学检验。

5.2 卡方检验(2×C)结果

本研究中任一预测频数均大于5，所以根据Chi-Square Tests表格分析各组的差别。SPSS输出检验结果如下：

卡方检验(2×C)结果显示 χ²=9.175，P = 0.010，说明本研究中各组之间率的差值与0的差异具有统计学意义，提示药物干预与饮食、运动干预在降低受试者胆固醇浓度的作用上存在不同。如果P>0.05，那么就说明各组之间率的差值与0的差异没有统计学意义，即不认为各组之间存在差异。

5.3 卡方检验(2×C)中的成对比较分析

如果卡方检验(2×C)的P<0.05，说明至少有两组之间的差异存在统计学意义。SPSS输出的risk_level * intervention Crosstabulation表格通过数字标记提示了两两比较的结果，如下标注部分：

大家可能会注意到，每组数据的标记相同（即上下两行的标记相同），那么我们只要知道组间标记的作用即可。

那么，risk_level * intervention Cross tabulation表格的标记是什么意思呢？第一种情况，各组间无差异，如下：

如上图，各组间标记一致，说明各组之间无差异。第二种情况，任意两组之间均存在差异，如下：

即每组标记字母均不相同，说明任意两组之间的差异均存在统计学意义。第三种情况，有些组之间存在差异，而另一些组之间的差异没有统计学意义，如下：

如果任两组之间标记字母相同，说明这两组之间的差异没有统计学意义；如果两组标记字母不同，说明这两组之间的差异存在统计学意义。

根据这一原则，分析本研究结果如下：

该表说明，在本研究中，药物干预的降胆固醇作用(“a”)与饮食干预的降胆固醇作用(“b”)的差异存在统计学意义(P<0.05)，药物干预的降胆固醇作用(“a”)也与运动干预的降胆固醇作用(“b”)的差异存在统计学意义(P<0.05)，而饮食干预(“b”)与运动干预(“b”)在降胆固醇的作用上没有差异。

6、撰写结论

6.1 若卡方检验(2×C)的P<0.05

本研究招募150位高胆固醇、生活习惯差的受试者，随机分组后分别给予药物、饮食和运动干预。试验结束时，药物干预组有34位(68%)胆固醇浓度下降，饮食干预组有22位(44%)胆固醇浓度下降，而运动干预组有20位(40%)胆固醇浓度下降，三组差异具有统计学意义(P=0.010)。

成对比较结果提示，药物干预的降胆固醇效果好于饮食或运动干预(P<0.05)，而饮食与运动干预在降低胆固醇浓度上的作用无差异(P>0.05)。

6.2 若卡方检验(2×C)的P≥0.05

本研究招募150位高胆固醇、生活习惯差的受试者，随机分组后分别给予药物、饮食和运动干预。试验结束时，药物干预组有24位(48%)胆固醇浓度下降，饮食干预组有22位(44%)胆固醇浓度下降，而运动干预组有20位(40%)胆固醇浓度下降，三组结果的差异没有统计学意义（P=0.620）。

（如果你想使用文中数据进行练习，请随时给小咖（微信：xys2016ykf）发消息，小咖将原始数据发给你。）

更多阅读

1. SPSS教程：两个率的比较(卡方检验)及Fisher精确检验

2. 分类、有序、定量变量...你清楚你的变量类型吗？

3. 【合集】23种统计方法的SPSS详细操作

医咖会微信：medieco-ykh

关注医咖会，轻松学习统计学~

有临床研究设计或统计学方面的难题？快加小咖个人微信（xys2016ykf），拉你进统计讨论群和众多热爱研究的小伙伴们一起交流学习。如果想进群，添加小咖时请注明“加群”二字。

点击左下角“阅读原文”，看看医咖会既往推送了哪些统计教程。

观察｜官方通报陕西蒲城一职校学生坠亡：事发前与舍友发生口角和肢体冲突认定该生系高空坠落死亡

桐城一派｜倒在“跨年夜”的龚书记，13个字换来免职调查冤不冤？

比佟丽娅还恋爱脑，怀孕7次流产4次，目睹丈夫背叛却选择原谅

市管干部“龚书记”免职迷局

讣告！又一知名女星在家中去世，终年54岁，曾是无数人白月光…